计算机与现代化 ›› 2013, Vol. 1 ›› Issue (5): 7-9.doi: 10.3969/j.issn.1006-2475.2013.05.002
王森洪1,戴青云2,曹江中1,朱婧1
WANG Sen-hong1, DAI Qing-yun2, CAO Jiang-zhong1, ZHU Jing1
摘要: 在数据聚类当中,谱聚类是最流行的方法之一,其性能取决于所选取相关图的拉普拉斯(Laplacian)矩阵的特征向量。对于一个K类问题,Ng-Jordan-Weiss(NJW)谱聚类算法通常采用Laplacian矩阵的前K个最大特征值对应的特征向量作为数据的一种表示。然而,对于某些分类问题,这K个特征向量不一定能够很好地体现原始数据的信息。本文提出一种基于均值的谱聚类特征向量选择算法。该算法首先得出图的Laplacian矩阵的前3K个最大特征值的均值,然后选取K个离均值最近的特征值所对应的特征向量。相比传统谱聚类算法,该算法在UCI数据集上获得了较好的聚类性能。
中图分类号: